标签【Deep Reinforcement Learning】

深度学习课程笔记（七）：模仿学习（imitation learning） 2017.12.10 　　　　本文所涉及到的模仿学习，则是从给定的展示中进行学习。机器在这个过程中，也和环境 ...

Recurrent Models of Visual Attention Google DeepMind 　　模拟人类看东西的方式，我们并非将目光放在整张图像上，尽管有时候会从总体上对目标进 ...

强化学习策略梯度方法之: REINFORCE 算法（从原理到代码实现） 2018-04-01 15:15:42 最近在看policy gradient algorithm, 其中一种 ...

[TOC] #马里奥AI实现方式探索 ——神经网络+增强学习儿时我们都曾有过一个经典游戏的体验，就是马里奥（顶蘑菇v），这次里约奥运会闭幕式，日本作为2020年东京奥运会的东道主，安倍最后也已经 ...

Proximal Policy Optimization Algorithms Updated on 2019-09-14 16:15:59 Paper: https://arxiv.or ...

Active Object Localization with Deep Reinforcement Learning ICCV 2015 　　最近Deep Reinforcement ...

Dueling Network Architectures for Deep Reinforcement Learning ICML 2016 Best Paper 　摘要：本文 ...

Bilinear CNN Models for Fine-grained Visual Recognition CVPR 2015 　　　　本文提出了一种双线性模型( biline ...

Multiple Object Recognition With Visual Attention Google DeepMind ICRL 2015 　　　　本文提出了一种基于 ...

分布式强化学习基础概念（Distributional RL） from: https://mtomassoli.github.io/2017/12/08/distributional_r ...